Modèles de Coût pour la Sélection de Vues Matérialisées dans le Nuage, Application aux Services Amazon EC2 et S3
نویسندگان
چکیده
Résumé. La performance des entrepôts de données est classiquement assurée grâce à des structures comme les index ou les vues matérialisées. Dans ce contexte, des modèles de coût permettent de sélectionner un ensemble pertinent de ce type de structures. Toutefois, cette sélection devient plus complexe dans les nuages informatiques, car en plus des temps de réponse, il faut simultanément optimiser le coût monétaire. Nous proposons dans cet article de nouveaux modèles de coût intégrant le paiement à la demande en vigueur dans les nuages. Sur la base de ces modèles, nous définissons un problème d’optimisation consistant à sélectionner, parmi des vues candidates, celles à matérialiser pour minimiser le coût d’interrogation et de maintenance, ainsi que le temps de réponse pour une charge de requêtes donnée. Dans un premier temps, nous optimisons les deux critères séparément : le temps est optimisé sous contrainte de coût et vice versa. Notre proposition est ensuite validée de manière expérimentale.
منابع مشابه
Sélection simultanée d'index et de vues matérialisées
Résumé. Les index et les vues matérialisées sont des structures physiques qui accélèrent l’accès aux données d’un entrepôt. Ces structures engendrent cependant une surcharge de maintenance. Par ailleurs, elles partagent le même espace disque. Les travaux existants dans le domaine de la sélection d’index et de vues matérialisées traitent ces deux structures de manière isolée. Dans cet article, n...
متن کاملA Constraint Satisfaction based Approach to View Selection in a Distributed Context
Les vues matérialisées sont utilisées dans les systèmes de gestion de bases de données commercialisés pour accélérer le temps de traitement des requêtes. Cette technique est aussi très utile dans les entrepôts de données pour améliorer les performances des requêtes décisionnelles. Cependant, le problème de sélection de vues a été étudié surtout dans un contexte centralisé. Dans cet article, nou...
متن کاملView Selection in Semantic Web Databases
We consider the setting of a Semantic Web database, containing both explicit data encoded in RDF triples, and implicit data, implied by the RDF semantics. Based on a query workload, we address the problem of selecting a set of views to be materialized in the database, minimizing a combination of query processing, view storage, and view maintenance costs. Starting from an existing relational vie...
متن کاملUne sélection multiple des structures d'optimisation dirigée par la méthode de classification K-means
Résumé. Le volume d’information contenu dans un entrepôt de données s’accroît sans cesse, augmentant de ce fait le temps d’exécution des requêtes décisionnelles. Pour y remédier, l’administrateur doit, durant la phase de conception physique de l’entrepôt, effectuer une sélection de structures d’optimisation (index, vues matérialisées ou fragmentation), puis assurer leur gestion et maintenance. ...
متن کاملResilin: Elastic MapReduce for Private and Community Clouds
The MapReduce programming model, introduced by Google, offers a simple and efficient way of performing distributed computation over large data sets. Although Google’s implementation is proprietary, MapReduce can be leveraged by anyone using the free and open source Apache Hadoop framework. To simplify the usage of Hadoop in the cloud, Amazon Web Services offers Elastic MapReduce, a web service ...
متن کامل